import json

def generate_json(input_file, output_file):
    # 打开并读取原始 JSON 文件
    with open(input_file, 'r', encoding='utf-8') as f:
        data = json.load(f)

    # 初始化一个列表，用来存放生成的 JSON 数据
    result = []

    # 假设每一条数据都有用户提问和作者回答
    for item in data:
        instruction = item.get('用户提问', '')  # 用户提问
        output = item.get('作者回答', '')  # 作者回答
        # input_text = item.get('additional_info', '')  # 额外信息（如果有）

        # 构建新的 JSON 格式数据
        result.append({
            "instruction": instruction,
            "input": "",
            "output": output
        })

    # 将新的数据写入到输出文件
    with open(output_file, 'w', encoding='utf-8') as f:
        json.dump(result, f, ensure_ascii=False, indent=4)

# 调用函数，输入文件为 output_copy.json，输出文件为生成的新 JSON
generate_json('train_cf/src/20250623/output copy.json', 'train_cf/src/20250623/formatted_output.json')
